Analyse par composantes principales et la Classification ascendante hiérarchique

1 - La représentation de l’analyse par composantes principales avec les 3 axes principaux retenus

Les points sur le graphique représentent les différentes observations, ici nos familles professionnelles. Les axes correspondent aux trois principales composantes retenues dans notre Analyse en Composantes Principales (ACP). Le premier axe explique la plus grande part de la variance (40,7 %), suivi du deuxième axe (24,4 %) et enfin du troisième axe (18,3 %).
Dans notre ACP nous avons exclu trois familles professionnelles, les Patrons et cadres de l’hôtellerie et de la restauration, les Dirigeants d’entreprises et Artisans et ouvriers artisanaux.

Chardon (2005) indique que Les deux premières familles professionnelles sont les deux seules exclusivement exercées par des non-salariés. La famille professionnelle des artisans et ouvriers artisanaux comprend des salariés, mais il s’agit plutôt d’un résidu de métiers non classés et affectés par défaut.

Nous réintegrons ces 3 familles dans nos classes, premierement en projetant ces 3 observations sur l’espace engendré par les trois axes de notre ACP, puis nous atribuons à chacune de ces 3 familles la classe dont elle est la plus proche du centroïde.
Les observations rajoutées sont visibles par leurs forme en diamand et les centroïdes des 5 classes sont les croix. Cliquez ici pour voir uniquement les observations réintégrées et les centroïdes (Retour).

La variance expliquée par chaque axe est détaillée dans la section 2, tandis que l’explication des variables contribuant à la variance de chaque axe est présentée dans la section 3.

Dans la section 4, nous revenons sur le choix de classifier les données en cinq classes.

Nos familles professionnelles ont été regroupées en 5 classes à l’aide d’une classification ascendante hiérarchique, dont nous détaillerons la méthodologie ultérieurement. Sur notre plan en trois dimensions, ces 5 classes sont illustrées par des couleurs distinctes. La section 5 présente en détail la répartition des familles dans chaque classe, ainsi que la manière dont elles se distinguent selon les 7 variables appliquées dans notre ACP (Classe 1, Classe 2, Classe 3, Classe 4, Classe 5).

2 - Le pourcentage de variance expliquée pour chacun des 3 axes principaux retenus

Ici nous ne retenons que les trois premiers axes pour notre analyse, à eux trois ils captent (40.7% + 24.4% +18.3% = 83.4%) de la variance totale dans nos données, il est d’usage de ne pas prendre trop d’axes pour ne pas avoir de “bruit blanc” dans l’analyse.

3 - La contribution des 7 variables pour les 3 axes principaux retenus

3.1 - La dimension 1, qui compte pour 40.7% de la variance expliquée

3.2 - La dimension 2, qui compte pour 24.4% de la variance expliquée

3.3 - La dimension 3, qui compte pour 18.3% de la variance expliquée

4 - La classification ascendante hiérarchique

Avec la CAH, on cherche à ce que les individus regroupés au sein d’une même classe (homogénéité intra-classe) soient le plus semblables possibles tandis que les classes soient le plus dissemblables (hétérogénéité inter-classe).

Le principe de la CAH est de rassembler des individus selon un critère de ressemblance défini au préalable qui s’exprimera sous la forme d’une matrice de distances, exprimant la distance existant entre chaque individu pris deux à deux.

Ici, nous présentons le dendrogramme découpé en 5 classes selon la méthode de la distance de φ². Ce choix semble être un bon compromis, car il correspond à un embranchement récent dans l’arbre tout en restant éloigné de la scission suivante.

Ce qui nous est confirmé par le graph ci-dessus, la classification en 5 classes semble optimale pour notre étude.

5 - Les 5 classes et leurs particularités

Ce tableau nous permet de constater les differences entre les 5 classes de la CAH, la classe 1 et 2 comportent toutes deux plus de 20 FAP, avec 25 pour la première et 23 pour la deuxième, les trois classes restantent comptent chacune 13 ou 12 FAP.

Avec 85 FAP ou total, l’ensemble de l’emploi en France comporte une proportion relativement faible de jeunes sans spécialité de formation, avec une moyenne de 4% et un Q3 de 9%.
Les jeunes dans l’ensemble des FAP sont modérément représentés, avec un Q1 de 14% et une moyenne de 18%, ce qui reflète une tendance générale modérée. Les jeunes en embauche représentent 45%.
L’emploi dans l’ensemble des FAP est stable, avec une moyenne de 50% du temps passé dans la même entreprise.
L’ensemble des FAP présente une grande diversité de spécialités de formation, avec une disparité assez marquée et une concentration moyenne de ces spécialités.

5.1 - La Classe 1

Avec ses 25 FAP, cette classe se distingue par une très faible proportion de jeunes sans spécialité de formation (y compris sans diplôme), avec une moyenne de 1% et un Q3 de 2%, en comparaison avec une moyenne de 4% et un Q3 de 9% pour l’ensemble des FAP.
Malgré cette faible représentation de jeunes sans spécialité, on observe une part importante de jeunes dans cette classe, avec un Q1 de 16% et une moyenne de 19%, contre un Q1 de 14% et une moyenne de 18% pour l’ensemble des FAP. De plus, les jeunes sont plutôt surreprésentés dans l’embauche, cette classe ayant la part des jeunes en embauche la plus élevée, avec 50% (contre 45% pour l’ensemble des FAP).
L’emploi y est très stable, en moyenne les travailleurs ont passé 58% de leur expérience professionnelle dans leur entreprise actuelle. Sur ce critère, cette classe est également la première, avec une moyenne de 50% pour l’ensemble des FAP.
Dans cette classe, les FAP sont plutôt soumises à des spécialités de formation spécifiques, avec une concentration notable de celles-ci. L’indice de disparité est dans la moyenne, ce qui témoigne de certaines disparités dans les spécialités des travailleurs.

5.2 - La Classe 2

Avec ses 23 FAP, cette classe présente une proportion de jeunes sans spécialité de formation relativement plus élevée, avec une moyenne de 12% et un Q3 de 15%. En comparaison, l’ensemble des FAP a une moyenne de 4% et un Q3 de 9%.
Les jeunes dans cette classe sont modérément représentés, avec un Q1 de 13% et une moyenne de 15%, légèrement inférieure à la moyenne de 18% de l’ensemble des FAP. Les jeunes en embauche représentent 32% des effectifs, un peu moins que pour l’ensemble des FAP (45%).
L’emploi dans cette classe est également assez stable, avec une moyenne de 38% du temps passé dans la même entreprise. La moyenne pour l’ensemble des FAP est de 50%.
Les FAP de cette classe ont une proportion assez faible de spécialités de formation spécifiques, bien que l’indice de concentration soit toujours assez élevé. L’indice de disparité est élevé, suggérant une diversité dans les spécialités des travailleurs.

5.3 - La Classe 3

Avec ses 12 FAP, cette classe se caractérise par une proportion importante de jeunes sans spécialité de formation, avec une moyenne de 1% et un Q3 de 3%. En comparaison, l’ensemble des FAP présente une moyenne de 4% et un Q3 de 9%.
Les jeunes dans cette classe sont relativement bien représentés, avec un Q1 de 20% et une moyenne de 23.5%, bien supérieure à la moyenne de 18% pour l’ensemble des FAP. De plus, ils sont plutôt surreprésentés dans l’embauche, avec une moyenne de 51% de jeunes embauchés (contre 45% pour l’ensemble des FAP).
L’emploi dans cette classe est également assez stable, avec une moyenne de 51% du temps passé dans la même entreprise. Cela est supérieur à la moyenne de 50% pour l’ensemble des FAP.
Les FAP de cette classe sont très spécialisées dans leurs domaines de formation, avec une forte concentration de spécialités spécifiques. L’indice de disparité est faible, ce qui indique une certaine homogénéité des formations.

5.4 - La Classe 4

Avec ses 12 FAP, cette classe présente une proportion de jeunes sans spécialité de formation assez faible, avec une moyenne de 5.5% et un Q3 de 11.5%, supérieure à la moyenne de 4% pour l’ensemble des FAP.
Les jeunes sont relativement bien représentés, avec un Q1 de 18.5% et une moyenne de 22.5%, supérieure à la moyenne de 18% pour l’ensemble des FAP. Les jeunes en embauche représentent 48%, une proportion élevée, similaire à l’ensemble des FAP.
L’emploi dans cette classe est assez stable, avec une moyenne de 41% du temps passé dans la même entreprise, légèrement inférieure à la moyenne de 50% pour l’ensemble des FAP.
Les FAP de cette classe ont une proportion importante de spécialités, avec un indice de concentration élevé et une disparité moyenne, suggérant une certaine diversité dans les formations.

5.5 - La Classe 5

Avec ses 12 FAP, cette classe a une proportion de jeunes sans spécialités de formation légèrement supérieure à la moyenne, avec une moyenne de 5.5% et un Q3 de 11.5%.

Les jeunes y sont relativement bien représentés, avec un Q1 de 18.5% et une moyenne de 22.5%. La part des jeunes en embauche est également importante, avec 48%.

L’emploi y est cependant moins stable, avec seulement 41% de l’expérience professionnelle passée dans l’entreprise actuelle, ce qui est inférieur à la moyenne générale.

Concernant les spécialités de formation, cette classe a un indice de spécificité faible (0.46) et une concentration modérée (0.74), indiquant une relative diversité des spécialisations.